智能论文笔记

Pushing the performances of ASR models on English and Spanish accents

Pooja Chitkara , Morgane Riviere , Jade Copet , Frank Zhang , Yatharth Saraf

分类：自然语言处理

2022-12-22

Speech to text models tend to be trained and evaluated against a single target accent. This is especially true for English for which native speakers from the United States became the main benchmark. In this work, we are going to show how two simple methods: pre-trained embeddings and auxiliary classification losses can improve the performance of ASR systems. We are looking for upgrades as universal as possible and therefore we will explore their impact on several models architectures and several languages.

translated by 谷歌翻译

Improving Data Driven Inverse Text Normalization using Data Augmentation

Laxmi Pandey , Debjyoti Paul , Pooja Chitkara , Yutong Pang , Xuedong Zhang , Kjell Schubert , Mark Chou , Shu Liu , Yatharth Saraf

分类：自然语言处理 | 机器学习

2022-07-20

逆文本归一化（ITN）用于将自动语音识别（ASR）系统的口语输出转换为书面形式。传统手工制作的ITN规则可以复杂地转录和维护。同时，神经建模方法需要与ASR系统相同或相似的域（内域数据）中的质量大规模口语写作示例。这两种方法都需要昂贵且复杂的注释。在本文中，我们提出了一种数据增强技术，该技术可有效地从室外文本数据中产生丰富的口语写入数字对，并以最少的人类注释。我们从经验上证明，使用我们的数据增强技术训练的ITN模型始终超过ITN模型，该模型仅使用14.44％的总体准确性，仅在所有数字表面（例如红衣主教，货币和分数）上使用内域数据进行训练。

translated by 谷歌翻译

Optimization of Rocker-Bogie Mechanism using Heuristic Approaches

Harsh Senjaliya , Pranshav Gajjar , Brijan Vaghasiya , Pooja Shah , Paresh Gujarati

分类：神经与进化计算

2022-09-14

在动态地形和环境中，最佳的运动和有效遍历外星漫游器是行星科学和地球物理系统领域的重要问题陈述。为行星流浪者的悬架机理设计最高级有效的架构是迈向健壮的流浪者的关键步骤。本文重点介绍了摇杆转型机制，这是一种与外国地形相关的标准悬架方法。在审查了可用的先前文献并利用各种优化和全局最小化算法之后，本文提供了一项有关流浪者悬架机制的机械设计优化的新研究。本文对模拟退火，遗传算法，群智能技术，盆地希望和差异进化进行了广泛的测试，同时彻底评估了每个相关的超级参数，以找到效用驱动的解决方案。我们还评估了上述任务的双重退火和子公司算法，同时保持了道德研究的无偏测试角度。计算效率和整体适应性被认为是评估相关算法的关键磁性参数，还重点是可变输入种子，以找到最合适的效用驱动策略。在经验上获得了模拟退火，成为表现最佳的启发式策略，其适合度为760，其优于其他算法，并在各种输入种子和个体性能指标上提供了一致的性能。

translated by 谷歌翻译

HANF: Hyperparameter And Neural Architecture Search in Federated Learning

Jonas Seng , Pooja Prasad , Devendra Singh Dhami , Kristian Kersting

分类：机器学习

2022-06-24

自动化机器学习（AUTOML）是使机器学习模型被广泛应用于解决现实世界问题的重要步骤。尽管有许多研究的进步，但机器学习方法主要由于其数据隐私和安全法规而尚未完全被行业利用，因此在中心位置存储和计算增加数据量的高成本以及最重要的是缺乏专业知识。因此，我们介绍了一个新颖的框架，hanf -$ \ textbf {h} $ yperparameter $ \ textbf {a} $ nd $ \ textbf {n} $ earural架构搜索$ \ textbf {f}为在几个数据所有者服务器上分布的数据建立一个自动框架，而无需将数据带到中心位置。 HANF使用基于梯度的神经体系结构搜索和数据分布式设置中分别使用基于梯度的神经体系结构搜索和$ n $ armed Bandit方法来共同优化学习算法的神经体系结构和非构造超参数。我们表明，HANF有效地找到了优化的神经体系结构，并在数据所有者服务器上调整了超参数。此外，HANF可以在联合和非填充设置中应用。从经验上讲，我们表明HANF使用图像分类任务收敛于合适的体系结构和非架构高参数集。

translated by 谷歌翻译

A Combined PCA-MLP Network for Early Breast Cancer Detection

Md. Wahiduzzaman Khan Arnob , Arunima Dey Pooja , Md. Saif Hassan Onim

分类：计算机视觉

2022-06-18

乳腺癌是所有癌症类型的第二大责任，多年来一直是许多死亡的原因，尤其是在女性中。现有诊断系统的任何即兴创作以检测癌症，都可以最大程度地减少死亡率。此外，最近阶段的癌症检测是科学界的主要研究领域，以提高生存率。正确选择机器学习工具可以确保高精度的早期预后。在本文中，我们研究了不同的机器学习算法，以检测患者是否可能面临乳腺癌。由于早期特征的隐式行为，我们实施了与PCA集成的多层感知模型，并建议它比其他检测算法更可行。我们的4层MLP-PCA网络已获得100％的最佳精度，而BCCD数据集的平均精度为90.48％。

translated by 谷歌翻译

Leveraging Clinically Relevant Biometric Constraints To Supervise A Deep Learning Model For The Accurate Caliper Placement To Obtain Sonographic Measurements Of The Fetal Brain

Hari Shankar , Adithya Narayan , Shefali Jain , Divya Singh , Pooja Vyas , Nivedita Hegde , Purbayan Kar , Abhi Lad , Jens Thang , Jagruthi Atada

分类：计算机视觉

2022-03-28

多项研究表明，从孕妇中期超声检查（USG）检查获得标准化的胎儿脑生物特征？获得这些测量值是高度主观的，专业驱动的，需要多年的培训经验，从而限制了所有怀孕母亲的优质产前护理。在这项研究中，我们提出了一种深度学习方法（DL）方法，以通过准确和自动化的卡钳放置（每次生物测量法）将其作为地标建模，从而从跨炉平面（TC）的2D USG图像（TC）计算3个关键的胎儿脑生物特征。检测问题。我们利用了临床相关的生物识别约束（卡尺点之间的关系）和与域相关的数据增强，以提高U-NET DL模型的准确性（经过训练/测试：596张图像，473个受试者/143张图像，143个受试者）。我们进行了多个实验，证明了DL主链，数据增强，推广性和基准测试，通过广泛的临床验证（DL与7位经验丰富的临床医生）对最新的最新方法进行了测试。在所有情况下，单个卡尺点和计算生物特征的放置的平均误差都与临床医生之间的错误率相当。所提出的框架的临床翻译可以帮助新手用户在可靠和标准化的胎儿大脑超声图评估中的新手使用者。

translated by 谷歌翻译

Machine Learning: Algorithms, Models, and Applications

Jaydip Sen , Sidra Mehtab , Rajdeep Sen , Abhishek Dutta , Pooja Kherwa , Saheel Ahmed , Pranay Berry , Sahil Khurana , Sonali Singh , David W. W Cadotte

分类：机器学习 | 人工智能

2022-01-06

近期目睹了机器学习算法系统的快速发展，尤其是加强学习，自然语言处理，计算机和机器人视觉，图像处理，语音和情感处理和理解。凭借机器学习模型，算法及其应用的越来越重要和相关性，并且随着更多创新使用的深度学习和人工智能的情况，目前的体积呈现出一些创新研究工作及其在现实世界中的应用，如股票交易，医疗和医疗保健系统和软件自动化。本书中的章节说明了如何设计，优化和部署机器学习和深度学习算法和模型。该体积对于高级毕业生和博士生，研究人员，大学教师，练习数据科学家和数据工程师，专业人士和顾问以及在机器学习，深度学习和人工智能的广泛领域。

translated by 谷歌翻译

DeepTMH: Multimodal Semi-supervised framework leveraging Affective and Cognitive engagement for Telemental Health

Pooja Guhan , Naman Awasthi , Ritwika Das , Manas Agarwal , Kathryn McDonald , Kristin Bussell , Dinesh Manocha , Gloria Reeves , Aniket Bera

分类：计算机视觉

2020-11-17

为了帮助现有的Telemental Mechanical服务，我们提出Deeptmh，这是一种通过提取对应于心理学文献经常使用的情感和认知特征的潜视和认知特征来模拟Telemental Mealth Session视频的新框架。我们的方法利用半监督学习的进步来解决Telemental Healts Sessience视频领域的数据稀缺，包括多模式半监督GaN，以检测Telemental卫生课程中的重要心理健康指标。我们展示了我们框架的有用性和与现有工作中的两项任务对比：参与回归和价值回归，这两者都对心理学家在眼药性健康会议期间对心理学家很重要。我们的框架报告了RMSE在参与回归中的RMSE方法的40％，并在价值唤醒回归中的SOTA方法中的50％改善。为了解决Telemental Health空间中公开的数据集的稀缺性，我们发布了一个新的数据集，Medica，用于心理健康患者参与检测。我们的数据集，Medica由1299个视频组成，每节3秒长。据我们所知，我们的方法是基于心理驱动的情感和认知功能来模拟Telemental Healts会话数据的第一种方法，这也通过利用半监督设置来解决数据稀疏性。

translated by 谷歌翻译